Prediksi Pembatalan Pemesanan pada Reservasi Kamar Hotel

By: Gustavo Thiodorus (Newton Day)

Background

Sektor pariwisata merupakan salah satu sektor yang dapat memacu pertumbuhan ekonomi suatu negara bahkan di dunia. Menurut data yang dihimpun dari laporan World Travel & Tourism Council pada tahun 2019 tentang dampak pariwisata terhadap ekonomi dunia, sektor pariwisata menyumbang 10,4% dari Produk Domestik Bruto (PDB) dunia dan juga 3,8% dari total jumlah pekerja di seluruh dunia bekerja di bidang pariwisata. Prediksi pada tahun 2029 mendatang, sumbangan sektor pariwisata terhadap Produk Domestik Bruto (PDB) dunia akan meningkat 3,7% menjadi 11,5% dari PDB dunia dan juga total pekerja di bidang pariwisata akan meningkat 2,1% menjadi 4,2%. Berdasarkan data tersebut sektor pariwisata ternyata sangat berpengaruh terhadap keberlangsungan ekonomi dunia yang juga berdampak langsung terhadap masyarakat. Berbicara tentang sektor pariwisata tentu tidak lepas dengan industri perhotelan yang merupakan penunjang keberlangsungan industri pariwisata di suatu daerah.

title

Sebagai salah satu negara yang memiliki iklim pariwisata yang sangat baik, Portugal dihadapkan dengan berbagai masalah. Menurut berita yang terkini dihimpun dari CNBC pada tahun 2021, sebanyak 90% dari total reservasi kamar hotel dibatalkan oleh turis akibat adanya perubahan regulasi dari pemerintah Inggris mengenai kewajiban karantina yang setelah kembali dari Portugal. Sebelum adanya regulasi karantina ini, perusahaan dengan jaringan hotel terbesar di Portugal, Pestana Hotel Group, mencatat kenaikan 50 sampai 60 persen reservasi kamar hotel dibandingkan dengan tahun 2017 dan 2019. Fenomena ini menunjukkan bahwa dalam waktu singkat pelaku industri hotel dapat mendapatkan keuntungan namun di satu sisi juga dapat memperoleh kerugian yang justru dapat membahayakan keberlangsungan dari industri hotel itu sendiri

Di Indonesia sendiri peranan hotel dalam industri pariwisata memang sangat penting sebagai sarana akomodasi bagi turis mancanegara maupun turis lokal. Menurut data yang dihimpun dari Badan Pusat Statistik di Indonesia, Tingkat Penghunian Kamar (TPK) hotel klasifikasi bintang di Indonesia pada November 2018 mencapai rata – rata 60,19 persen yang menunjukkan ketercukupan jumlah kamar hotel di Indonesia bagi para wisatawan. Namun, pada tahun 2019 menurut Hariyadi Sukamdani, Ketua PHRI (Persatuan Hotel dan Restoran Indonesia) bahwa akan ada penambahan jumlah unit kamar mencapai 50.000 kamar dan berpotensi bertambah menjadi 60.000 kamar. Melihat pernyataan ini, maka diyakini bahwa industri hotel akan semakin bertambah banyak digemari oleh para pebisnis.

Pelaku industri hotel yang semakin hari semakin bertambah banyak akan dihadapkan dengan berbagai tantangan. Salah satu tantangan ialah revolusi industri 4.0 yang membuat pelaku industri hotel harus dapat beradaptasi dengan memanfaatkan peran teknologi dalam keberlangsungan usahanya. Salah satu pemanfaatan teknologi yang marak dalam industri adalah analisis big data. Menurut Harvard Business Review pada artikel Domainesia, 99% pelaku bisnis yang disurvei melaporkan mereka ingin menganalisis Big Data dan menggunakan Artificial Intelligence namun hanya 30% yang benar – benar melakukannya. Pada dasarnya, analisis dari pemanfaatan big data itu sendiri dapat meningkatkan kepuasan pelanggan, menciptakan kampanye pemasaran, serta menghadirkan penawaran yang personal.

Melihat pentingnya pemanfaatan big data dalam proses pengambilan keputusan dalam sebuah perusahaan, pada proyek kali ini akan dilakukan analisis data pemesanan hotel di Portugal untuk mengetahui penyebab pembatalan pesanan yang secara langsung berdampak kepada aktivitas operasional dari hotel tersebut. Hasil analisis tersebut dapat dimanfaatkan oleh pihak manajemen hotel untuk mengetahui alasan yang rinci mengenai penyebab pembatalan pemesanan dan juga dapat mengantisipasi tindak pembatalan pemesanan untuk kedepannya dengan melakukan prediksi dari pesanan yang dilakukan oleh customer

Problem Statement

Pembatalan reservasi kamar hotel merupakan hal yang sulit untuk dihindari. Banyak sekali faktor yang memengaruhi pembatalan reservasi kamar hotel. Analisis berdasarkan intuisi dan pengamatan oleh tim manajemen perhotelan tidak cukup dapat menggaransi untuk mengetahui secara pasti penyebab pembatalan reservasi kamar hotel dikarenakan banyaknya faktor penyebab. Saat ini banyak bisnis hotel sudah menggunakan sistem deposit untuk "menggaransi" reservasi kamar hotel yang sudah dibuat oleh customer. Namun, hal ini masih belum cukup seimbang apabila dibandingkan dengan persiapan yang sudah dilakukan untuk penyambutan kedatangan customer dan juga terdapat potensi keuntungan yang hilang akibat pembatalan reservasi kamar apalagi yang dilakukan mendekati hari kedatangan.

Project Idea

Tindak pencegahan pembatalan reservasi kamar hotel dapat dilakukan secara dini dengan menggunakan machine learning yang dapat memprediksi pembatalan reservasi dengan melihat faktor-faktor penyebab. Alasan yang pasti akan tindak pembatalan reservasi juga dapat diketahui secara faktual berdasarkan data yang ada melalui metode pengolahan dan interpretasi data.

Problem Scope

Dataset yang digunakan berisi data pemesanan sebuah hotel di daerah kota dan sebuah hotel di daerah resor di negara Portugal; data yang dikoleksi seperti kapan pemesanan dilakukan, lama tinggal tamu di hotel, banyak tamu dewasa, banyak tamu anak-anak, banyak tamu bayi, jumlah ruang parkir tersedia, dan 25 fitur lainnya. Dataset ini berasal dari sebuah artikel yang diterbitkan oleh ScienceDirect.

Artikel ini ditulis oleh Nuno Antonio, Ana Almeida, dan Luis Nunes untuk jurnal Data in Brief, Volume 22, Februari 2019. Berdasarkan artikel ScienceDirect tersebut, diketahui bahwa kedua hotel berlokasi di Portugal (“H1” berada di daerah resor di Algarve dan “H2” berada di kota Lisbon). Jarak antara dua lokasi ini kurang lebih 280 km dengan mobil dan kedua lokasi berbatasan dengan Atlantik Utara. Tujuan pengumpulan data tersebut adalah untuk memprediksi sebab-sebab kamar dibatalkan.

Kolom-kolom yang terdapat dalam dataset ini, antara lain:

Selanjutnya, dalam pembuatan model machine learning untuk melakukan prediksi pembatalan reservasi kamar hotel menggunakan variabel is_canceled untuk target variabelnya, dan variabel lain sebagai prediktor yang tentunya akan melalui serangkaian tahap feature engineering terlebih dahulu.

Model machine learning yang akan dibuat adalah model klasifikasi (supervised learning) dengan memanfaatkan algoritma berbasis Decision Tree, yaitu Random Forest dan XGBoost.

Output

Output dari proyek ini akan berupa dashboard menggunakan bahasa pemrograman Python dengan framework Dash. Dashboard akan menampilkan Explanatory Data Analysis dari data yang telah ada untuk menampilkan informasi tentang penyebab-penyebab tindak pembatalan reservasi kamar hotel. Selanjutnya akan terdapat form untuk mengisi data-data reservasi kamar hotel dan kemudian akan ditampilkan hasil berupa probabilitas potensi pembatalan dan rekomendasi strategi yang dapat dilakukan pihak hotel menggunakan metode LIME/SHAP untuk mendapatkan hasil interpretasi model machine learning yang robust.

Business Impact

Dengan mengetahui faktor-faktor atau fitur-fitur penyebab pembatalan pemesanan kamar hotel melalui analisis data, pihak manajemen perhotelan dapat menerapkan strategi yang tepat untuk meminimalisir tindak pembatalan pemesanan. Selain itu, tindakan antisipasi dengan cepat juga dapat dilakukan dengan menganalisis fitur-fitur yang terdapat pada pemesanan yang berpotensi untuk terjadi pembatalan dengan memberikan insentif atau promosi tambahan agar tindak pembatalan tidak terjadi.

Exploratory Data Analysis

Import Library and Data

Berdasarkan hasil yang didapatkan, diperoleh informasi bahwa pada dataset terdapat 119390 baris dan 32 kolom data.

Missing Value Handling

Terdapat beberapa kolom pada data yang memiliki nilai NaN atau dapat dikategorikan sebagai missing value. Berikut solusi yang dilakukan untuk mengatasi missing value.

Sudah tidak terdapat missing value pada data yang digunakan.

Data Coercion

Berdasarkan informasi mengenai tipe data yang diperlihatkan di atas, dapat diambil kesimpulan bahwa beberapa kolom/fitur belum memiliki tipe data yang sesuai. Berikut merupakan penyesuaian tipe data pada beberapa kolom/fitur yang terdapat pada data.

Pada beberapa kolom yang memiliki nilai unik dilakukan perubahan tipe data ke tipe data category untuk menghemat memori. Selain itu pada kolom is_canceled dan is_repeated_guest dilakukan mapping agar lebih mudah diinterpretasi.

Pada kolom children diubah tipe datanya menjadi int karena merupakan kolom numerik dengan data berupa bilangan bulat.

Pada kolom reservation_status_date diubah menjadi tipe data datetime sesuai dengan data pada kolom tersebut.

Berikut merupakan tipe data kolom final setelah dilakukan pengubahan tipe data.

Dive Deeper Dataset

Pada bagian ini akan dilakukan dive deeper terkait dengan data yang digunakan untuk mendapatkan pemahaman yang lebih mendalam terkait dengan data yang digunakan.

Proporsi Kelas

Berdasarkan visualisasi di atas dapat dilihat bahwa proporsi target lebih banyak dimiliki kelas 'Not Cancel' (63%) dibandingkan dengan kelas 'Cancel' (37%) yang berarti bahwa kasus pembatalan reservasi lebih jarang terjadi. Selain itu proporsi tipe hotel didominasi oleh hotel dengan tipe 'City' sebanyak 66% dibandingkan denga tipe 'Resort' sebanyak 34%. Insight ini dapat digunakan untuk proses pelatihan pada model machine learning untuk menambah data pada kelas minoritas agar didapatkan proporsi target yang lebih seimbang

Persentase Status Pembatalan Reservasi dari Minggu ke Minggu

Berdasarkan visualisasi di atas dapat dilihat bahwa mayoritas dari hari ke hari reservasi dengan status 'Not Cancel' lebih banyak daripada pemesanan dengan status 'Cancel' dengan tren yang cenderung menurun yang justru menjadi signal baik untuk pihak manajemen hotel. Namun ada 251 hari dimana kasus reservasi dengan status 'Cancel' lebih banyak daripada reservasi dengan status 'Not Cancel' yang perlu diperhatikan dengan cermat oleh pihak manajemen untuk menemukan penyebab lebih banyak pembatalan reservasi.

Distribusi Waktu Tunggu Reservasi

Berdasarkan hasil visualisasi di atas dapat dilihat bahwa reservasi yang dibatalkan cenderung memiliki selisih hari antara pemesanan dan kedatangan yang lebih banyak daripada reservasi yang tidak dibatalkan yang mayoritas memiliki selisih hari antara pemesanan dan kedatangan dibawah rata-rata. Hal ini menunjukkan kecenderungan pelanggan bahwa semakin lama rentang waktu/selisih antara pemesanan maka peluang untuk membatalkan pemesanan juga semakin tinggi.

Persentase Status Pembatalan Reservasi antara Tipe Kamar yang Dipesan dan Tipe Kamar yang Didapatkan

Berdasarkan hasil visualisasi di atas dapat dilihat bahwa mayoritas customer mendapatkan kamar sesuai dengan yang direservasi yang berbanding lurus dengan tingkat pembatalan yang juga semakin tinggi (Tidak ada warna berarti tidak berpasangan). Selain itu, melalui visualisasi ini dapat dikatakan bahwa antara kamar yang dipesan dan kamar yang disediakan tidak memengaruhi pembatalan. Hal ini dapat dilihat dari hasil visualisasi dimana hanya sebagian kecil terdapat kasus pembatalan dimana kamar yang direservasi berbeda dengan kamar yang disediakan. Namun, ada tiga kasus dimana terjadi pembatalan sebesar 100%. Setelah ditelaah lebih 2 dari 3 tersebut hanya direservasi sebanyak 1 kali dan dibatalkan sehingga mencapai persentase pembatalan sebesar 100%. Hal yang menarik adalah pada kasus reservasi kamar tipe P dimana customer juga mendapatkan kamar dengan tipe yang sama, terjadi pembatalan sebanyak 12 kali dari 12 kali reservasi yang dilakukan sehingga mencapai persentase pembatalan sebesar 100%.

References

  1. World Travel & Tourism Council (2019). TRAVEL & TOURISM ECONOMIC IMPACT 2019 WORLD. London: World Travel & Tourism Council, pp.3-4.
  2. Badan Pusat Statistik (2019). Perkembangan Pariwisata dan Transportasi Nasional November 2018. Jakarta: BPS RI, pp.6-8. SFachrezzy, A. (2020). Potensi Bisnis Pariwisata dan Kebutuhan 50.000 Unit Kamar Hotel Tahun 2019. [Blog] Kompasiana. Available at: https://www.kompasiana.com/achmadsf/5da97afa0d82306ff254e222/potensi-bisnis-pariwisata-kebutuhan-50-000-unit-kamar-hotel-thn-2019?page=2 [Accessed 9 Oct. 2021].
  3. Editor, M. (2015). Mengapa Hotel Harus Menerapkan Analisis Big Data?. [Blog] Markeeters. Available at: https://marketeers.com/mengapa-hotel-harus-menerapkan-analisis-big-data/ [Accessed 9 Oct. 2021].
  4. Quarantines, negative tests and vaccine certificates: How Portugal’s hotels are coping this summer. (2021). [Blog] CNBC. Available at: https://www.cnbc.com/2021/08/16/how-hotels-in-portugal-are-coping-this-summer.html [Accessed 9 Oct. 2021].
  5. Pemanfaatan Big Data Untuk Meningkatkan Bisnis. (2019). [Blog] Domainesia. Available at: https://www.domainesia.com/berita/pemanfaatan-big-data-adalah/ [Accessed 9 Oct. 2021].